一 . 概述

朴素贝叶斯是一种概率算法,基于条件概率这样概念。它具有容易实现,训练速度很快等优点。

二 . 所属分类

朴素贝叶斯属于 监督学习。

三 . 贝叶斯推理公式

其中 P(A) P(B) 为先验概率

四 . 练习题

已知一种传染病的感染概率为万分之一,医生检查准确率为99%,如果一个病人结果为阳性,请问他得这种传染病的概率是多少?

A = 感染 B = 健康 R = 后验概率

答案

P(A) = 0.0001 (得病概率)
P(B) = 0.9999 (健康概率)
P(R|A) = 0.99 (后验得病概率)
p(R|B) = 0.01 (后验健康概率)
P(A|R) = 0.0001 0.99 / (0.0001 0.99 + 0.9999 * 0.01) = 0.0098

五 . 贝叶斯算法

1 . Gaussian Naive Bayes

2 . Multinomial Naive Bayes

3 . Complement Naive Bayes

4 . Bernoulli Naive Bayes

5 . Categorical Naive Bayes

6 . Out-of-core naive Bayes model fitting

六 . sklearn 多项式朴素贝叶斯(Multinomial Naive Bayes)示例

1
2
3
4
5
6
7
8
9
10
11
12
import numpy as np
from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB()

rng = np.random.RandomState(1)

X = rng.randint(10, size=(2, 100))
y = np.array([1, 2])

clf.fit(X, y)

yred = clf.predict(X[0:1])